سفارش تبلیغ
صبا ویژن

داده کاوی4

4 کاوشگری وNLP پیشرفته .

کاوشگری باعث استفاده ازتکنیک هایی ازیادگیری ماشین خاص ,مستقل ,حوزه وپردازش زبان طبیعی می شود.بااین حال ,بسیاری ازسیستم های فعال درعلوم زیستی ,ازاطلاعات زبانی خیلی کمی استفاده می کند. یعنی فقط ازریشه کلمه یا اجزاء_کلام.

این امرممکن است منجربه تعبیرغلط ازشواهدایجادشده شود,برای مثال,ازآنجایی که روابط موضوع_هدف وروابط نقیض نادیده گرفته می شود. بنابراین ,استفاده از اطلاعات زبانی بیشتر,امکان واضعی برای بهبودسیستم به شمار می آید. به ویژه به عنوان ابزار برای ایجاد چنین اطلاعاتی اصولا" درجامعه NLP ,دردسترس است.

به هرحال ,گاهی اوقات, چنین تلاش هایی نتایج ناامید کننده ای راگزارش می کنند.

دلایل برای این یافته ها ,متنوع است که شامل تطبیق ناکافی یافقد صحت تجزیه گرها ازتکنیک های استخراج به منظور ارائه ی اطلاعات درمتن ,می شود.

دومین روزسمینار,جهت ارائه گزارشات درباره پیشرفت های تخصصی ,درسیستم های متن کاوی وبرنامه های کاربردی,اختصاص یافت. بازشناسی موجودیت مشهور,موضوعی داغ در مرکزکاوشگری برای سال ها بودکهدرحال حاضر,درکانون مذاکرات توسط تدبرسیکو, پیترمری_رست ومارتین هافکمن,قرار گرفته است.

تدبرسیکونتایج امیدوارکننده ای درباره بهبودصحت نام های شناسایی شده ازژن های پروازی درمتن راگزارش کرده که یک کارخیلی سخت می باشد. دوسخنران دیگر,آخرین نتایج ازبه کاربردن متن کاوی برای موجودیت های شیمیایی رارائه دادندکه به ویژه شامل تجزیه وتحلیل تصاویر درمتن به منظوربهبود ساختار شیمیایی می شود. پیشرفت هایی درسیستم ها برای استخراج روابط توسط گوران ننادیک (دانشگاه منچستر,انگلستان)وجونگ_ج کیم (کمبریج, انگلستان)ارائه شده بود. سیستمی ,منطقه مهم خاصی راپوشش می دهد,راه حل تکرار یک یا چند عبارت متوالی درمتن ,توسط سوجیانگ نشان داده  شد. به ویژه ,این سیستم هم چنین ,به عنوان وب سرور دردسترس است که درخط مستقیم کاوشگری توزیع شده جهانی شامل خواهد شد.